Loading...
机构名称:
¥ 2.0

4有关最新实施大师级国际象棋程序的示例,而无需搜索,请参见Ruoss等。[RDM24]。此实现使用了大型(270 M参数)训练有素的神经网络位置评估器,并且非常适合在MPC-MC体系结构中使用;请参阅第4节。5用RL术语,我们可以将Q(x,u)视为对(x,u)的Q因子。我们采用了较小的Q因子对应于更好移动的惯例。6对于某些发动机,E(x)的公式并非严格正确,因为修剪了X的某些法律移动,因此定义E(x)的最小化是近似的。7一些国际象棋引擎并非真正没有记忆。例如,他们构建了评估位置的哈希表,这些位置是从一个动作到另一个游戏过程中的下一个。发动机记忆对MPC-MC性能的影响是一个尚未完全评估的复杂问题。

arxiv:2409.06477v1 [cs.ai] 10月10日2024

arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第1页

arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第2页

arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第3页

arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第4页

arxiv:2409.06477v1 [cs.ai] 10月10日2024PDF文件第5页

相关文件推荐

2024 年
¥1.0
2025 年
¥19.0
2024 年
¥1.0